পরিসংখ্যানের এই তিনটি গুরুত্বপূর্ণ মাপকাঠি ডেটাসেটের বৈচিত্র্য, স্থিতিশীলতা এবং তুলনামূলক বৈশিষ্ট্য নির্ধারণে ব্যবহৃত হয়। এগুলো সম্পর্কে বিস্তারিত আলোচনা নিচে উপস্থাপন করা হলো।
সংজ্ঞা:
ভেদাংক হলো একটি ডেটাসেটের মানগুলোর গড় থেকে কতটা বিচ্যুতি ঘটেছে তার গড় বর্গ। এটি ডেটাসেটের বৈচিত্র্য পরিমাপের জন্য একটি গুরুত্বপূর্ণ মাপকাঠি।
ভেদাংক নির্ণয়ের সূত্র:
যেখানে,
উদাহরণ:
বৈশিষ্ট্য:
সংজ্ঞা:
বিভেদাংক হলো ডেটাসেটের মানগুলোর ছড়িয়ে পড়া বা বৈচিত্র্যের পরিমাপ। এটি ডেটার সর্বোচ্চ ও সর্বনিম্ন মানের মধ্যকার পার্থক্য, গড় থেকে বিচ্যুতি, বা অন্যান্য সূচকের মাধ্যমে নির্ধারণ করা হয়।
প্রকারভেদ:
১. বিস্তার (Range): সর্বোচ্চ এবং সর্বনিম্ন মানের পার্থক্য।
Range = Maximum Value - Minimum Value
২. আন্তঃচতুর্ভাগ বিস্তার (Interquartile Range - IQR):
IQR= Q3 - Q1
৩. গড় বিচ্যুতি (Mean Deviation):
৪. মান বিচ্যুতি (Standard Deviation):
গুরুত্ব:
সংজ্ঞা:
সহভেদাংক হলো ডেটাসেটের মান বিচ্যুতি এবং গড়ের অনুপাত, যা শতাংশে প্রকাশ করা হয়। এটি বিভিন্ন ডেটাসেটের তুলনা করার জন্য ব্যবহৃত হয়।
সহভেদাংক নির্ণয়ের সূত্র:
যেখানে,
উদাহরণ:
গুরুত্ব:
বিষয় | ভেদাংক (Variance) | বিভেদাংক (Dispersion) | সহভেদাংক (CV) |
---|---|---|---|
সংজ্ঞা | ডেটার গড় থেকে বিচ্যুতির গড় বর্গ | ডেটার বৈচিত্র্য পরিমাপ | আপেক্ষিক বৈচিত্র্য শতাংশে প্রকাশ |
পরিমাপের একক | ডেটার বর্গ এককে (Squared Units) | ডেটার মূল এককে (Original Units) | শতাংশে (Percentage) |
ব্যবহার | বৈচিত্র্য এবং স্থিতিশীলতা নির্ধারণ | বৈচিত্র্যের প্রকৃতি বোঝার জন্য | তুলনামূলক বিশ্লেষণে |
প্রভাবিত চরম মান দ্বারা | হ্যাঁ | নির্ভর করে | নির্ভর করে |
এই তিনটি মাপকাঠি ডেটা বিশ্লেষণে ভিন্ন ভিন্ন প্রয়োজনে ব্যবহৃত হয় এবং প্রতিটির নিজস্ব গুরুত্ব রয়েছে।
Read more